# 导入必要的库
import pandas as pd
import jieba
import joblib
from sklearn.feature_extraction.text import TfidfVectorizer

# ===========================
# 1️⃣ 加载模型和向量化器
# ===========================
# 加载训练好的 SVM 模型
svm_model = joblib.load('svm_model.joblib')

# 定义分词器函数
def chinese_tokenizer(text):
    return jieba.lcut(text)
# 加载对应的 TF-IDF 向量化器
tfidf_vectorizer = joblib.load('tfidf_vectorizer.joblib')

# ===========================
# 2️⃣ 文本预处理和特征提取
# ===========================
def preprocess_text(text):
    """
    对输入的中文文本进行分词，并返回分词后的文本。
    """
    # 使用 jieba 进行中文分词
    words = jieba.lcut(text)
    # 将分词结果拼接成字符串，词之间用空格分隔
    processed_text = ' '.join(words)
    return processed_text

def extract_features(text):
    """
    对输入文本进行预处理和特征提取，返回 TF-IDF 特征向量。
    """
    # 预处理文本
    processed_text = preprocess_text(text)
    # 转换为 TF-IDF 特征向量
    text_tfidf = tfidf_vectorizer.transform([processed_text])
    return text_tfidf

# ===========================
# 3️⃣ 情感预测函数
# ===========================
def predict_sentiment(text):
    """
    对输入的文本进行情感预测。
    返回值：1 表示正面情感，0 表示负面情感。
    """
    # 提取特征
    text_tfidf = extract_features(text)
    # 进行情感预测
    sentiment = svm_model.predict(text_tfidf)[0]
    return sentiment

# ===========================
# 4️⃣ 测试情感预测
# ===========================
if __name__ == "__main__":
    # 示例文本
    sample_text = ("新年伊始，不少产业链企业就围绕自动驾驶展开布局。在2025年国际消费电子展（简称“CES 2025”）上，英伟达与丰田等巨头宣布将合作开发“下一代汽车”；索尼与本田也在双方合作开发的首款电动车上，引入了AI自动驾驶辅助功能。与此同时，政策对自动驾驶的支持力度正得到前所未有的加强。中国信息通信研究院发布的《车联网白皮书》预计，到2025年，我国智能汽车市场规模将接近万亿元。自动驾驶行业已经按下了“加速键”。"
                   "近日，由海富通基金、上海证券报共同举办的“海谈科技”无人驾驶专场成功举行。上汽集团旗下友道智途副总经理、首席科学家、智能驾驶中心总经理衡量，上海交通大学机械与动力工程学院教授、博士生导师王亚飞，国泰君安证券汽车行业首席分析师吴晓飞三位重磅嘉宾参与本场直播，共同围绕无人驾驶的应用趋势、技术路线及发展前景展开深入讨论。)"
                   "三位专家分别从产、学、研的不同视角切入，观点却不谋而合。他们认为，政策对自动驾驶的支持力度正得到前所未有的加强，自动驾驶产业已经按下了“加速键”，正在加速成为中国的又一“新质生产力”，并将带动产业链上的软硬件公司共享技术进步的市场红利。"
                   "技术成熟产业迎来爆发期"
                   "随着成本下降，理想汽车、小米汽车、华为和赛力斯等企业对发展自动驾驶业务的态度非常积极，纷纷推出智驾时间表。业内专家指出，特斯拉和比亚迪等新能源车巨头在自动驾驶产业链的布局也值得高度关注。"
                   "“如今，自动驾驶落地的要素都逐步具备了。”作为最早接触自动驾驶的学者之一，王亚飞坦言，自动驾驶不是什么新事物，但之前不管是硬件平台还是软件算法，都不足以支撑自动驾驶。现在的软硬件都在飞速发展，自动驾驶落地的可能性非常高。"
                   "王亚飞还记得，他的第一次自动驾驶体验是课题组的自动驾驶样车，刚开始还是比较紧张的，时间长了以后才慢慢放松起来。最近，无论是乘坐robotaxi（无人驾驶出租车），还是具备高阶辅助驾驶功能的乘用车，很明显的变化是，舒适性和平顺性都明显提高，自动驾驶技术的成熟首先带来的就是明显的体感变化。"
                   "吴晓飞认为，在自动驾驶技术发展大潮中，中国一个重要优势就是成本优势。中国的科技型企业一旦进入到规模化量产，有能力把成本快速打下来，进入一个正向循环，这是很多发达国家不具备的优势。"
                   "作为深耕自动驾驶领域的连续创业者，衡量的自动驾驶“初体验”也经历了从“忐忑不安”到“泰然处之”的历程。他将自动驾驶类比为和无线通信、智能手机同等重要的一次技术革命。"
                   "如今，友道智途正在依托上海洋山港“5G+L4”智能重卡项目的技术积累和成功经验，聚焦港口、厂区等特定场景与干线物流场景的L4级和L3级自动驾驶产品，打造“技术+产品+运营”的全新业务模式。在出海方面，2024年底，作为中国智能驾驶技术的代表，友道智途还携40台L4级智能驾驶集卡，参与建设南美首个智慧港口——秘鲁钱凯港的运营，这也是中国智能驾驶技术首次大规模出海。")
    # 进行情感预测
    sentiment = predict_sentiment(sample_text)
    # 输出结果
    print(f"输入文本: {sample_text}")
    print(f"情感预测: {'正面' if sentiment == 1 else '负面'}")
